به کارگیری روش یادگیری تقویتی برای مسیریابی پویا در شبکه به عنوان یک سیستم چند عاملی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
- نویسنده سعید مجیدی
- استاد راهنما مسعودرضا هاشمی مازیار پالهنگ
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1386
چکیده
شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان انطباق پذیری بیشتر با تغییر حالات شبکه تحقیق کرده اند که این الگوریتمها بر پایه روش های یادگیری ماشین بنا شده اند. یادگیری تقویتی یک روش یادگیری بدون سرپرست است که هدف از آن یادگیری یک سیاست، نگاشتی از مشاهدات به اعمال، بر مبنای بازخوردی است که از محیط دریافت می شود. این عمل یادگیری را می توان به صورت جستجوی مجموعه ای از سیاست ها نگریست که در هر لحظه در تعامل با محیط ارزیابی می شوند. در میان الگوریتم های مختلفی که برای یادگیری تقویتی تاکنون ارایه شده است الگوریتم یادگیری-q دارای بیشترین کاربرد است. در این پایان نامه به شبکه به عنوان یک سیستم چندعاملی نگریسته شده است که هر گره آن نشان دهنده یک عامل می باشد. سپس بر پایه روش یادگیری تقویتی و با استفاده از الگوریتم یادگیری-q هر یک از عامل ها شروع به یادگیری وضعیت شبکه می نماید تا در هر حالت شبکه بهترین عمل ممکن را از خود بروز دهد. در این روش وضعیت هر گره (عامل) به صورت تابعی از وضعیت گره های مجاور و خطوط ارتباطی مابین آن ها تعریف می شود و بدین صورت هر تغییر در وضعیت یک گره (عامل) در وضعیت و نحوه تصمیم گیری گره های (عاملین) مجاور آن تأثیرگذار است.
منابع مشابه
یک روش چند عاملی جدید مبتنی بر یادگیری تقویتی برای شکلدهی ترافیک و تخصیص حافظه بافر در روترها
Normal 0 false false false EN-US X-NONE AR-SA MicrosoftInternetExplorer4 ...
متن کاملیک روش چند عاملی جدید مبتنی بر یادگیری تقویتی برای شکل دهی ترافیک و تخصیص حافظه بافر در روترها
چکیده دراین مقاله با توجه به ساختار توزیع شده شبکه های کامپیوتری و رفتار تصادفی موجود در آنها و از طرف دیگر محدودیت های زمانی که در الگوریتم های کنترلی برای اینگونه سیستمها وجود دارد، از مفاهیم سیستم های چند عاملی و تکنیک های یادگیری تقویتی برای شکل دهی ترافیک در روترها و تخصیص دینامیک حافظه بافر بین پورت های مختلف یک روتر استفاده شده است. در واقع با استفاده از این مفاهیم شکل دهنده ترافیک جدیدی...
متن کاملیادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک
در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...
متن کاملیک روش ترکیبی جدید یادگیری تقویتی فازی
در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه میشود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته میشود. هدف، یافتن مناسبترین عمل نامزد (تالی) برای هر قاعده میباشد. با استفاده از بردار شدت آتش قواعد فازی و ...
متن کاملکنترلکننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت بههمپیوسته شامل SMES
هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترلکنندههای PID و SMES مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیهای حرارتی است. ابتدا تنظیم پارامترهای کنترلکنندههای PID و SMES بهصورت یک مسئله بهینهسازی مدلشده توسط الگوریتم تدریس - یادگیری اصلاحشده حل میشود. سپس عملکرد همزمان آنها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه میگردد. کنتر...
متن کاملیادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک
در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023